4Л 


УДК 004.932.2:004.383.5 


Ю.В. Ладиженський, А.О. Середа 
Донецький національний технічний університет, Україна 


Іу(дс8.4ети.ЧопеїяКк ма, аа5!(аК.ти 


Пошук фрагментів зображень 
за шаблоном для відстежування об'єктів 
у відео на паралельній архітектурі СОДА 


Розглянуто пошук фрагментів зображень довільної форми в кадрі за шаблоном методом повного перебору 
із використанням паралельної обчислювальної архітектури СТОЛА. Запропоновано і проаналізовано 
різні способи кешування області пошуку в пам'яті мультипроцесора. Експериментально оцінено прискорення 
порівняно з центральним процесором. Запропоновані алгоритми можуть використовуватись для 
прискорення відстежування об'єктів у відео. 


Вступ 


Необхідність відстежування об'єктів у відеопотоці виникає в системах безпеки, 
автоматизації аналізу спортивних змагань, контролю технологічних процесів, при орга- 
нізації людино-машинного інтерфейсу. Під відстежуванням розуміється отримання 
множини видимих об'єктів 1 їх координат у кожному кадрі. 

Пошук зображень за шаблоном є одним із методів відстежування об'єктів у відео. 
У |П| шаблон цілого об'єкта представлений зображенням об'єкта і матрицею, що 
задає ймовірність приналежності до об'єкта кожного пікселя цього зображення. У |2| 
описано метод відстежування об'єктів у відеопотоці на основі відстежування перемі- 
щення фрагментів об'єктів, які представлені шаблонами. Близька задача пошуку 
прямокутних блоків зображення у кадрі виникає при кодуванні відео |31. 

Одним із методів пошуку фрагмента зображення у кадрі є метод Іліса8-Кападе 
ігасКег, який базується на обчислені градієнтна зображення і переміщенні у напрямку 
зменшення функції різниці між кадром та шаблоном |4|. Іншим підходом є безпосе- 
реднє порівняння шаблона з областями кадру (31, 151, яке звичайно використовується 
при кодуванні відео. 

Пошук фрагмента зображення в кадрі може займати багато часу 1 потребує 
прискорення. Пошук складається з однотипних операцій над елементами матриць і 
може бути ефективно реалізований на паралельній обчислювальній архітектурі. Можна 
використовувати як спеціалізовані обчислювальні структури для пошуку фрагментів 
зображень в кадрі (5, так і паралельну архітектуру загального призначення. На даний 
час поширеними і доступними пристроями, придатними для паралельної обробки 
зображень 1 відео, є відеокарти ММІФІА з підтримкою технології СОДА |б). 

Хоча існують послідовні алгоритми пошуку шаблонів |З, (4) та паралельні реалі- 
зації алгоритмів пошуку блоків при кодуванні відео |31, |3|, не існує паралельних 
алгоритмів пошуку шаблонів зображень довільної форми, які можуть бути використані 
у методі відстежування об'єктів |21. 

Метою даної роботи є розробка нових алгоритмів пошуку шаблонів зображень 
довільної форми у кадрі для архітектури СОДА. У даній статті розглядається пошук 
шаблону методом повного перебору. 
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Постановка задачі 


Нехай фрагмент зображення, який шукають, вписано у прямокутник завширшки Й/ 
та заввишки Н. Нехай К - матриця розміром Нх///, що містить пікселі шаблону. 
Кожен піксель шаблону /,, (у 20,Н - І, х- 0,Й/ - 1) характеризується наступними 


властивостями: //,, /5,, 7/7, - відповідно красна, зелена та синя компоненти кольору; 


ух? ух 
нн Іо) - оцінка приналежності пікселя з координатами бо у) до фрагмента. Значен- 


ня /;, може бути чисельно не рівним ймовірності, але зі збільшенням ймовірності 


монотонно зростає. 

Назвемо областю пошуку прямокутну область кадру, що містить пікселі шаблону 
при всіх його можливих положеннях. Нехай її висота дорівнює Но, ширина - Йо,асС-- 
матриця розміром Н, х И/,, що містить її пікселі. Кожен піксель області пошуку с,, 


Я Є Б 
ух? сих 4 Су 


Нехай осі системи координат кадру і шаблону спрямовані вправо і вниз, а піксель 
із координатами (0,0) розташовано в лівому верхньому куті. 
Міру різниці між пікселем шаблону /, , і пікселем області кадру с,., визначимо як 


Ь Ь 
рив бу - уро ( аю - Су є є - бо б Гром ди Су . (1) 


Накладемо шаблон на кадр без повороту так, що піксель шаблону з коорди- 
натами (0,0) співпаде з пікселем кадру з координатами (х, у). Міру різниці між 


складається з с відповідно красної, зеленої та синьої компонент кольору. 


шаблоном і областю кадру під ним визначимо як 


И-І Н-І 
0(х»)- У, Уоннкоо (2) 


ахед дує 


Нехай 5 з (х,, у, ))| - множина всіх можливих координат лівого верхнього піксе- 
ля шаблону в системі координат області пошуку, причому 


ох АТ, осукн,тат-Мзі,Н,аН,-НЧІ. 


Найкращу позицію шаблону визначимо як р розі 19 РУ У бі) і а У бо загатівх У ) 7 


У методі відстежування |2| для визначення ймовірності успішного відстежування фраг- 
мента зображення об'єкта необхідно також визначати альтернативну найкращу по- 
зицію фрагмента, тобто кращу з позицій, що залишилися в області пошуку, З якої 
вилучено околицю кращої позиції: 
р зн тіп іх 
ЧО (оз)еду пін хи У Р (о), 
де а -- константа, що визначає розмір околиці, яка вилучається. 


Для визначення се асо) і 0, можна використовувати як повний перебір 


всіх можливих положень шаблону, так і швидкі алгоритми пошуку, засновані на 
монотонному зменшенні міри різниці між шаблоном і кадром при наближенні до 
оптимального рішення, такі, як ТРгее-5іер Зеагсі |3|. Для визначення ЩД,;, доцільно 
використовувати алгоритм повного перебору. Пошук шаблонів повним перебором є 
найбільш ресурсоємним етапом відстежування об'єктів у методі |2| 1 потребує 
прискорення. Далі розглядаються його реалізації на архітектурі СОДА. 
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Відображення алгоритму пошуку шаблону 
зображення на архітектуру СОДА 


Спрощена архітектура СОДА |6| наведена на рис. 1. Розглядаються пристрої з 
согариїе сотрайіу 1.1, як найпоширеніші на момент написання. 


Мультипроцесор М 


Мультипроцесор 1 


Спільна пам'ять (5рагед петогу) 


Регістри о- | Регістри | г | Регістри | й 


Процесор 1 Процесор | Процесор? | | Процесор? | є» | Процесор | 
пабннавнннаци 


2 СВО і Текстурний кеш 


Пристрій 
інструкцій 


Пам'ять пристрою (демісе плетогу) 


Рисунок 1 - Спрощена архітектура СОФА 


На одному мультипроцесорі може одночасно виконуватись один або більше блоків 
потоків. Загальна кількість потоків на мультипроцесорі звичайно перевищує кількість 
скалярних процесорів, і групи потоків виконуються на них по черзі. Планувальник 
потоків оперує групами (у/агр) із 32 потоків одного блоку із послідовними номерами. 
Блоки, для виконання яких не вистачає вільних ресурсів, чекають у черзі, поки інші 
блоки не завершать роботу. 

Для мінімізації обміну даними між пам'яттю пристрою та пам'яттю кожного 
мультипроцесора дані, що багато разів використовуються, доцільно читати один раз 1 
поміщати в текстурний кеш або спільну пам'ять. Для завантаження кожного пікселя Б і 
С з пам'яті пристрою мінімальне число раз, а також для усунення необхідності синхро- 
нізації і обміну даними між різними мультипроцесорами доцільно проводити пошук 
одного шаблону на одному мультипроцесорі, тобто використовувати для цього один 
блок потоків. Залежно від кількості потоків та спільної пам'яті в одному блоці мульти- 
процесор може одночасно шукати один чи більшу кількість шаблонів. 

На сучасних пристроях цілочисельні арифметичні операції виконуються приблиз- 
но в чотири рази повільніше, ніж операції з плаваючою точкою |/7). Доцільно зберігати 
в пам'яті колір пікселів як цілі однобайтні числа, а перед обчисленнями перетво- 
рювати їх в дійсні числа. 

При зверненні до пам'яті пристрою без використовування текстурного кешу 
бажано проводити з'єднані (соаїс5сеа) запити до пам'яті пристрою. Для цього 16 потоків, 
що виконуються одночасно, повинні звертатися до 16 чотирибайтних слів, розташо- 
ваних в пам'яті послідовно з адреси, кратної 64 (деякі потоки можуть не брати участь). 

Необхідність обчислювати /Д,;; спричиняє необхідність зберігати знайдені 
значення р, у) для 5. у) є 5. Їх об'єм може бути завеликий для зберігання в пам'яті 


мультипроцесора, тому вони зберігаються в пам'яті пристрою. Щоб набувати готові 
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значення (2) в регістрах, кожне значення 0 повинне обчислюватися одним потоком. 
Зручно, щоб група з 16 потоків обчислювала 16 значень Р, розташованих в пам'яті 
послідовно. Якщо потоків менше, ніж Н,//,, то деякі потоки можуть обчислювати і 
зберігати більше одного значення 0. 

При запропонованій організації обчислень прискорення пошуку множини 
шаблонів досягається як за рахунок одночасного пошуку різних шаблонів на різних 
мультипроцесорах, так і за рахунок одночасного обчислення значень (2) різними 
потоками для різних позицій шаблону. 


Загальний алгоритм пошуку шаблону 


Розглянемо частину алгоритму пошуку шаблону, яка не залежить від способу 
кешування області пошуку. 

Нехай є М потоків 1 1-й потік (і - 0, М - 1) обробляє множину позицій шаблону 
5" с. 5. Він обчислює і зберігає в пам'яті пристрою ДЩх, у) для всіх (х, у)є 5!. В про- 
цесі обчислення різних значень 0) кожен потік обчислює і зберігає у своїх регістрах 
значення РАМ УЗ аге нн р у)і 1 Дія З - ро , У) 


Й і і і 
Після завершення обчислення р, у) для (х, у)є 5, атакож Хід» Ура 1 Діру» 


для із-0,М-1І, визначається такий номер потоку ірогз;, ЩО Мао ал, рем 


Безі Безі 


(Фу - річ) ДІЇ Ат Потік ірех Зберігає в змінних в спільній пам'яті значення 


Безі 
що уче що убвев що Гуїве 
Хрем - Хе , У рез "5; Увеї , ре Голи 
Після обчислення Дргі кожен потік обчислює Ю», о б р, у), де 
х,У)Єбаи 


5, 25 М у): тіп(х - Хі ча 4). При цьому використовуються раніше 


збережені в пам'яті пристрою значення 0. Д), вибирається з рі так само, як на 
И-ІН-І 
І 


попередньому кроці /),,, З з | З Ом 10, діляться на норму ура рен 
хед у«-0 


Нижче розглянуто різні способи обчислення Р залежно від способу кешування 
області пошуку. В описаних нижче алгоритмах пікселі шаблону можуть бути 
розташовані як у текстурному кеші, так і в спільній пам'яті. 


Кешування області пошуку у текстурному кеші 


Пропонується схема розподілу задач по потоках: і-й потік обчислює множину 
позицій 5" « ((х-ні- /М)тод И/, (у кі )М)діУ М) для ) 0 (НОЙ, М -1-і)ФУМ, 
де фу позначає цілочисельне ділення, а под - залишок від ділення. Елементи масиву 
РО розташовано в пам'яті послідовно по рядках без дір з адреси, кратної 64. 

На рис. 2 показані три послідовні етапи пошуку шаблону розміром 3х3 пікселя 
в області пошуку розміром 7Х1 1 пікселів з використанням 16 потоків. Заштрихова- 
ними квадратиками показані пікселі, з якими на кожному кроці збігається лівий 
верхній кут шаблону, а сірим - вже оброблені пікселі. 


Псевдокод алгоритму обчислення х),, з Ура» Д),, і масиву Д показано на рис. 3. 


Безі 
Алгоритм може працювати при будь-яких значеннях Й/о, Но, Й та Н і забезпечує повне 


завантаження всіх потоків при Н.Й, є ((плод М ). Усі звернення до пам'яті пристрою 
є з'єднаними. 
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оброблено 


Рисунок 2 - Обробка області пошуку з використанням текстурного кешу 


Ді ПО 0 ( підготовка до обчислень |) 
каз 
поки Кк «Н,И/, ї цикл по позиціях шаблону ) 
хо катод Й; Ї визначення координат шаблону ) 
ус і7 К Фу Й/,; 
5:-0; ї обчислення (хо) 


для увід 0 до Н-1 
для х від 0 до //-1 
5-5ч рія (Ту, х) А уд зу, зх); 


зберегти ДЇ уд, Хо | 7 5; ї збереження результату ) 
якщо рр ім Р» 5 ї перевірка найкращого результату у потоці ) 
й рань і РЕваЮ і РР 
Ріеві 75; Хрем ПО Х05 Урен 1 /05 
кізЗКЯЕМ; ї перехід до наступної позиції шаблону |) 


Рисунок 3 - Алгоритм пошуку шаблону при використанні текстурного кешу 


Кешування області пошуку у спільній пам'яті 


Пропонується читати рядки області пошуку зверху вниз і зберігати використо- 
вувані на кожному кроці рядки в циклічному буфері. Нехай на кожному кроці (окрім 
першого) в буфер завантажується Й рядків, а після кожного читання перевіряється 
ИУ,я позицій шаблону. Щоб на кожному кроці при обчисленні Д (окрім, можливо, 
останнього кроку) були зайняті всі потоки, повинна виконуватись умова 
Й А є О(тод М). Визначимо мінімальну достатню для обчислень кількість блоків зав- 
вишки Й у буферіяк Кк - Пи яН- 1)/ п). Кожен /-Й рядок області пошуку зберігати- 
меться в рядку буфера із номером (і под КЛ). 

Наприклад, при Й - Н - 3, Йо - 10, Но - 7 можна вибрати значення Й - 2, 
М- 16 і Кк -2 (такі малі значення звичайно не виникають в задачі відстежування 
об'єктів, не є оптимальними і наведені для пояснення алгоритму). На рис. 44) 
показаний циклічний буфер, на рис. 46) показані три послідовні етапи обробки 
області пошуку. Заштрихованими квадратиками показані пікселі, з якими поєднується 
лівий верхній кут шаблону. 


а) 6) 


Рисунок 4 - Розбиття області пошуку по рядках 
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Для оптимальної роботи планувальника потоків СОДА повинна виконуватись 
умова М є О(тод 32) | 71, а значить, Й Пе О(тод 32). Для досягнення повного заван- 


таження потоків на останньому кроці повинна виконуватися умова (Н, -Неа 1) - (тоді). 


Читання кожного елементу області пошуку відбувається рівно один раз. 
Описаний алгоритм можна узагальнити на випадок, коли спільної пам'яті 
мультипроцесора не вистачає для зберігання буфера заввишки (КИ і завширшки Й/?). 
Пропонується використовувати циклічний буфер заввишки «й і завширшки у», 
причому (у 2 Й?. Величини К и / визначаються так само, як в попередньому алго- 
ритмі. На кожному кроці (окрім першого) в буфер завантажується Й рядків, а після 
кожного читання перевіряється (м -ЙИ з туп позицій шаблону. Кількість потоків є діль- 


ником (ур - Й/ -- тв . Кожен /-й рядок області пошуку зберігається в рядку буфера ( ) под КР) 5 


Область пошуку розбивається на стовпці завширшки (м -МИ 1) . Кожен стовпець, 
окрім останнього, обробляється так само, як в попередньому алгоритмі. Оскільки 
ширина буфера перевищує ширину стовпця, при завантаженні в буфер рядків /-го 
стовпця в буфер також потрапляють деякі елементи ( А 1) -го. Останній стовпець може 
мати ширину менше ніж (м ЗИ 1), і він обробляється, тільки якщо його ширина не 


менше Й. 

Наприклад, при Й - Н- 3, Йо - 12, Но - 8 можна вибрати значення Й - 3, у - 6, 
Ма8ік- 2. На рис. 5 а) показаний циклічний буфер, на рис. 5 б) показані три з 
дев'яти послідовних етапів обробки області пошуку при обраних параметрах. 


у - ЙИЧІ 


са 
с 


У 


ооо - 
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І 
І 
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І 
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І 
1 
І 
І 
І 
ю 
1 
І 
І 
І 
І 
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а) 6) 
Рисунок 5 - Розбиття області пошуку по рядках і стовпцях 


Для оптимальної роботи планувальника потоків СОДА повинна виконуватись 
умова М « ((тод 32), а значить, (м, - ПИ --Т)п є (тод 32). Для досягнення повного 
завантаження потоків при обробці нижнього ряду і правого стовпця блоків повинні 
виконуватися умови (Н., - Н - 1) (тод й) і (М/, - М -- 1) є О(тод(и/ -- Й/ --1)). 

При уз Йо даний алгоритм виконує розбиття області тільки по рядках і 
поводиться аналогічно попередньому. При у" я И/; алгоритм проводить повторні 
читання з пам'яті пристрою деяких значень с,,, : в середньому на кожні (м ЗИ 1) пік- 


селів алгоритм проводить у» читань. 

Псевдокод алгоритму, що проводить розбиття по рядках і стовпцях, приведений 
на рис. 6. 

Не для всіх можливих значень Й/, Но, Й 1 Н можливо вибрати значення 1, Кі М, 
що забезпечують оптимальне завантаження процесорів. У обох алгоритмах при будь- 
яких розмірах шаблону 1 області пошуку можливо зробити всі запити до пам'яті 
пристрою з'єднаними. 
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Ді ПО 0 1 підготовка до обчислень |) 
хі - Й; 1 (о, у) - координати лівого верхнього кута частини області пошуку, що 
кешується ) 
поки х| «И/, ї цикл по стовпцях області пошуку |) 
Ле 
поки | З ий Ізавантаження верхньої частини стовпця) 


якщо ( х; 4 / плоду» « /,)1( / дім уг « Н.,) 
ЬГ( Ам у/) тод Я, ) тод у) :- С) ФУ у, хі 8; под мб; 


і М; 
у 70; 
поки у, -Л «Н.І ї цикл по рядках області пошуку ) 
ія 
поки / «ий 1 завантаження рядків стовпця ) 


якщо ( х; 4 / тоду/ « Й, )1 (у; 19 / Фу у» є Но) 
Ь (у: 3.) фу м) тод Й, у под у) 12 С у; 1 / ФУ му, хі 1 / под мі; 
і/7 М; 
виконати синхронізацію потоків; | дочекатися кінця завантаження області пошуку) 
Ле 
поки ) « (м МИ тя ї цикл по позиціях шаблону ) 
хо. тод (м МИ 1); 7 (хо, уд) - координати позиції шаблону ) 
уд Фу (м Йо 1); ї всередині частини області пошуку у кеші ) 
якщо ( Уд у «НО і (хі тд «о 
5:-0; Ї обчислення Д(хо З Хі, уд 3 у1)) 
для увід 0 до Н-1 
р - посилання на Б|(уо З у; З у) тод й, хо Я хі; 
для х від 0 до М/-1 


з ев ж ім (Ду,х), рІХІ); 
зберегти ДІ уд Ж УХо 311 75; | збереження результату ) 
якщо Де 25 ї перевірка найкращого результату у потоці | 
і Кеди і АБУ і Канни 
Діеві 75; Хре ПО Х05 Урен 1/0 
і М; 

уяуЯНИ перехід униз до наступної групи рядків ) 
виконати синхронізацію потоків; (| дочекатися закінчення обчислень 


перед початком завантаження наступної частини області пошуку ) 
хііг охужм- Й ЗІ; ї перехід управо до наступного стовпця ) 


Рисунок 6 - Алгоритм пошуку шаблону при розбитті області по рядках і стовпцях 


Для алгоритму, що проводить розбиття по стовпцях і рядках, можлива модифі- 
кація: якщо ширина останнього стовпця не рівна (У - 1), то при його обробці можливо 
використовувати менше значення у" і більше значення Й, ніж для решти стовпців. Це 
може зменшити число кроків, необхідних для його обробки, внаслідок чого розши- 
риться множина значень Й/о, Но, // 1 Н, при яких алгоритм може працювати ефективно. 


Практичні результати 


Описані алгоритми реалізовано 1 протестовано на відеокарті СеКогсе 9800 СТ. 
Результати порівнювалися з однопотоковою реалізацією на процесорі Айіоп Х2 5400. 

Час пошуку 1000 фрагментів для запропонованих алгоритмів із використанням 
цілочисельної і дійсної арифметики приведено в табл. 1. Для СОДА наведено чистий 
час обчислень без урахування накладних витрат на передачу даних на відеокарту. 
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Таблиця 1 - Середній час пошуку 1000 фрагментів на СРО та СРО 


Час на СОФА Час на СОФА 
- Розмір На - 5 
Розмір області | центральному з використанням З використанням спільної 
шаблону пошуку | процесорі, ме текстурного кешу, мс пам'яті, мс 
цілочисельні дійсні цілочисельні | дійсні 

8 39 328 13,3 9,4 11,8 10,6 

8 71 1344 51,5 36,1 46,3 41,3 

16 79 4860 196 130 167 149 

16 143 19437 782 514 658 582 


Як видно з табл. І, використання відеокарти середнього рівня забезпечує при- 
скорення в порівнянні з одним ядром процесора приблизно в 36 разів. При цьому 
знижується завантаження ЦП і він може паралельно проводити інші обчислення. 
При використанні двох або чотирьох ядер процесора час обробки множини шаблонів 
скоротиться майже в два або чотири рази; очікується, що при відеокарті рівня 
СеБогсе СТ5 295 час обчислень на СОДА також скоротиться приблизно у чотири рази. 
На практиці прискорення може бути меншим через накладні витрати на підготовку 
даних у пам'яті пристрою. 

При використанні цілочисельної арифметики алгоритм з явним кешуванням 
даних в спільній пам'яті, оптимізованим для даної задачі, виявився ефективнішим за 
алгоритм, що використовує апаратно реалізований текстурний кеш, навіть коли об'єм 
використовуваної спільної пам'яті був менший за об'єм текстурного кешу. 

При приведенні даних до дійсного типу перед обчисленням (1) текстурний кеш 
виявився ефективнішим за рахунок швидкого перетворення цілого числа в норма- 
лізоване дійсне, що є неможливим для даних в спільній пам'яті. Це співвідношення 
може змінитися в майбутніх пристроях на користь спільної пам'яті при прискоренні 
операцій цілочисельної арифметики або перетворення типів. 


Висновки 


У статті представлено апаратно-орієнтовані алгоритми пошуку шаблонів зобра- 
жень довільної форми для паралельної архітектури СОДА. Вони можуть бути вико- 
ристані для підвищення швидкості відстежування об'єктів у відеопотоці за методом (2). 

Алгоритми реалізовані і досліджені експериментально. В порівнянні з одним 
ядром процесора АШіоп Х2 5400 на відеокарті СеБогсе 9800 СТ досягнуте зменшення 
часу пошуку множини фрагментів зображень до 36 разів. Використання пристрою з 
архітектурою СОДА може стати хорошою альтернативою використанню багатопро- 
цесорних ЕОМ або кластеру при відстежуванні об'єктів у відеопотоці. 

Досліджено кешування області пошуку у спільній пам'яті мультипроцесора та 
текстурному кеші. На сучасних пристроях СОДА доцільно використовувати текстур- 
ний кеш, але якщо у майбутніх пристроях буде прискорено виконання цілочисельних 
арифметичних операцій |71, для певних розмірів фрагменту та області пошуку може 
стати доцільним кешування області пошуку у спільній пам'яті. 

При великому розмірі області пошуку більше прискорення за рахунок зниження 
точності можна отримати при реалізації швидких алгоритмів пошуку шаблонів |3). 
При великому розмірі шаблону доцільно кешувати його у спільній пам'яті мульти- 
процесора по частинах. 
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Ще більше прискорення відстежування фрагментів при меншому енергоспо- 
живанні і апаратних витратах можливе при реалізації на ПЛІС спеціалізованого вектор- 
ного процесора для пошуку фрагментів зображень. При цьому можуть бути використані 
представлені в статті алгоритми кешування області пошуку. 
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Ю.В. Ладьженский, А.А. Середа 

Поиск фрагментов изображений по шаблону для отслеживания обьектов в видео 

на параллельной архитектуре СОФА 

Рассмотрен поиск фрагментов изображений произвольной формьт по шаблону методом полного перебора 
с использованием параллельной вьтчислительной архитектурьт СТА. Предложень и проанализированьт 
различньюе способью кзширования области поиска в памяти мультипроцессора. Зкспериментально 
оценено ускорениє по сравнению с центральньм процессором. Предложеннье алгоритмь могут 
использоваться для ускорения отслеживания обьектов в видео. 
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